# PATENT ABSTRACTS OF JAPAN

(11)Publication number:

2000-112585

(43) Date of publication of application: 21.04.2000

(51)Int.CI.

G06F 1/32

G06F 1/26

G06F 1/04

(21)Application number: 10-281610

**281610** (71)Applican

(71)Applicant: TOSHIBA CORP

(22)Date of filing:

02.10.1998

(72)Inventor: KAWABE NAOYUKI

**USAMI MASAYOSHI** 

# (54) SYSTEM LSI AND POWER MANAGEMENT METHOD

## (57) Abstract:

PROBLEM TO BE SOLVED: To provide a system LSI preventing the deterioration of performance due to the execution of the useless sleep of a CPU, and sharply improving a low power consumption effect. SOLUTION: This system LSI is provided with one or plural hardware modules M1-Mm for executing prescribed processing and a CPU 11 for controlling the operation of the hardware modules according to a program. This system LSI is also provided with a power management device 20 for controlling the stop and restar of clock supply to the CPU 11. That is, the CPU 11 is provided with a means for executing a sleep instruction for operating the stop of the clock supply to the CPU 11. The power management device 20 stops the clock supply to the CPU 11 based on the execution of the sleep instruction by the CPU 11, and restarts the clock supply to the CPU 11 at the time of receiving the end of the processing of the hardware modules.



# LEGAL STATUS

[Date of request for examination]

[Date of sending the examiner's decision of rejection]

[Kind of final disposal of application other than the examiner's decision of rejection or application converted registration]

[Date of final disposal for application]

[Patent number]

[Date of registration]

Number of appeal against examiner's decision of

rejection]
[Date of requesting appeal against examiner's decision of rejection]
[Date of extinction of right]

Copyright (C); 1998,2000 Japan Patent Office

#### \* NOTICES \*

Japan Patent Office is not responsible for any damages caus d by the use of this translation.

- 1. This document has been translated by computer. So the translation may not reflect the original precisely.
- 2. \*\*\*\* shows the word which can not be translated.
- 3.In the drawings, any words are not translated.

#### **CLAIMS**

## [Claim(s)]

[Claim 1] The system LSI characterized by forming the power management equipment which controls a halt and resumption of clock supply to Above CPU in the system LSI equipped with one or more hardware modules which perform predetermined processing, and CPU which controls operation of the aforementioned hardware module according to a program.

[Claim 2] It is the system LSI according to claim 1 which prepares a means to execute the sleep instruction for stopping clock supply to Above CPU in Above CPU, and is characterized by making the aforementioned power management equipment the composition which stops the clock supply to Above CPU based on execution of the aforementioned sleep instruction by Above CPU.

[Claim 3] The aforementioned power management equipment is a system LSI according to claim 2 characterized by making it the composition which resumes the clock supply to Above CPU in response to the end of processing of the aforementioned hardware module.

[Claim 4] The aforementioned sleep instruction is a system LSI according to claim 3 which has the 1st field which specifies by the end of processing of which hardware module the clock supply to Above CPU is resumed, and is characterized by making the aforementioned power management equipment the composition which resumes the clock supply to Above CPU with reference to the content of the 1st field of the above.

[Claim 5] The aforementioned sleep instruction is a system LSI according to claim 4 which has the 2nd field which specifies the register which stored the value of the 1st field of the above, and is characterized by making the aforementioned power management equipment the composition which resumes the clock supply to Above CPU with reference to the content of the above 1st and the 2nd field.

[Claim 6] The system LSI according to claim 2 to 5 characterized by making the routine in the aforementioned program used in order to wait for the end of processing of the aforementioned hardware module the composition automatically transposed to the aforementioned sleep instruction.

[Claim 7] It is the system LSI according to claim 1 to 6 characterized by making it the composition which it has the memory connected to Above CPU, and the aforementioned power management equipment stops clock supply in the aforementioned memory at the time of a halt of the clock supply to Above CPU, and resumes clock supply in the aforementioned memory at the time of resumption of the clock supply to Above CPU.

[Claim 8] The aforementioned memory is a system LSI according to claim 7 characterized by forming on the same chip as Above CPU, the aforementioned hardware module, and the aforementioned power management equipment.

[Claim 9] To the sleep instruction which it performs [instruction] in CPU and stops supply of the clock to this CPU When the content which directs the conditions of the operating state of the hardware module for making supply of the clock to CPU resume is included and CPU executes the aforementioned sleep instruction After storing the aforementioned conditions in the register, when the signal which stops supply of the clock to CPU is generated and the operating state of a hardware module agrees with the aforementioned conditions stored in the aforementioned register The power management method

| characterized by | generating    | the signal  | which makes    | s supply of the | e clock to CPU  | J resume. |
|------------------|---------------|-------------|----------------|-----------------|-----------------|-----------|
| Characterized by | 201101 001112 | are orbital | TITATE TITOTLA | Juppij or ui    | o olook to ol c | roculity. |

[Translation done.]

Translation of JP 2000-112585

## \* NOTICES \*

Japan Patent Office is not responsible for any damages caused by the use of this translation.

- 1. This document has been translated by computer. So the translation may not reflect the original precisely.
- 2. \*\*\*\* shows the word which can not be translated.
- 3.In the drawings, any words are not translated.

#### **CLAIMS**

## [Claim(s)]

[Claim 1] The system LSI characterized by forming the power management equipment which controls a halt and resumption of clock supply to Above CPU in the system LSI equipped with one or more hardware modules which perform predetermined processing, and CPU which controls operation of the aforementioned hardware module according to a program.

[Claim 2] It is the system LSI according to claim 1 which prepares a means to execute the sleep instruction for stopping clock supply to Above CPU in Above CPU, and is characterized by making the aforementioned power management equipment the composition which stops the clock supply to Above CPU based on execution of the aforementioned sleep instruction by Above CPU.

[Claim 3] The aforementioned power management equipment is a system LSI according to claim 2 characterized by making it the composition which resumes the clock supply to Above CPU in response to the end of processing of the aforementioned hardware module.

[Claim 4] The aforementioned sleep instruction is a system LSI according to claim 3 which has the 1st field which specifies by the end of processing of which hardware module the clock supply to Above CPU is resumed, and is characterized by making the aforementioned power management equipment the composition which resumes the clock supply to Above CPU with reference to the contents of the 1st field of the above. [Claim 5] The aforementioned sleep instruction is a system LSI according to claim 4 which has the 2nd field which specifies the register which stored the value of the 1st field of the above, and is characterized by making the aforementioned power management equipment the composition which resumes the clock supply to Above CPU with reference to the contents of the above 1st and the 2nd field.

[Claim 6] The system LSI according to claim 2 to 5 characterized by making the routine in the aforementioned program used in order to wait for the end of processing of the aforementioned hardware module the composition automatically transposed to the

aforementioned sleep instruction.

[Claim 7] It is the system LSI according to claim 1 to 6 characterized by making it the composition which it has the memory connected to Above CPU, and the aforementioned power management equipment stops clock supply in the aforementioned memory at the time of a halt of the clock supply to Above CPU, and resumes clock supply in the aforementioned memory at the time of resumption of the clock supply to Above CPU. [Claim 8] The aforementioned memory is a system LSI according to claim 7 characterized by forming on the same chip as Above CPU, the aforementioned hardware module, and the aforementioned power management equipment. [Claim 9] To the sleep instruction which it performs [instruction] in CPU and stops supply of the clock to this CPU When the contents which direct the conditions of the operating state of the hardware module for making supply of the clock to CPU resume are included and CPU executes the aforementioned sleep instruction After storing the aforementioned conditions in the register, when the signal which stops supply of the clock to CPU is generated and the operating state of a hardware module agrees with the aforementioned conditions stored in the aforementioned register The power management method characterized by generating the signal which makes supply of the clock to CPU resume.

#### **DETAILED DESCRIPTION**

# [Detailed Description of the Invention]

[0001]

[The technical field to which invention belongs] this invention relates to the system LSI which carried CPU and one or more hardware modules on the chip, and the power management method of realizing the low-power-ization.
[0002]

[Description of the Prior Art] Generally, the conventional system LSI has the composition of having carried on the chip CPU111, two or more hardware modules M0, M1, -, Mn, and the memory 112 that stores an instruction and data, as shown in

drawing 20. CPU111 issues the processing instruction other than the processing which itself performs to hardware modules M0-Mn. The operating state of hardware modules M0-Mn, i.e., execution of the processing which was performing given processing or was given, is completed, and the operating state whether the following processing instruction is waiting or to be among sleep is supervised by CPU111.

[0003] About low-power-izing of this system LSI, the following technology is proposed, for example. (1) CPU111 stops supply of the clock to the hardware modules M0-Mn, and attains low-power-ization in the period when some hardware modules M0-Mn do not need to be operating by changing these hardware modules M0-Mn into a sleep state. (2) If a hardware module M0 - Mn itself end the given processing, low-power-ization will be attained by changing into a sleep state automatically. [0004]

[Problem(s) to be Solved by the Invention] However, about low-power-izing of the conventional system LSI, the power consumed by CPU occupies many of power consumed with the whole chip, and has been a technical problem with important low-

power-izing of CPU.

[0005] From such a viewpoint, the following can be considered as the technique of changing CPU111 into a sleep state. There is a period when CPU111 cannot perform the next processing until hardware modules M0-Mn end the processing to which predetermined was given from relations, such as data dependence, like, when CPU111 performs the next processing as a period which can change CPU111 into a sleep state using the result of the processing which hardware modules M0-Mn performed, for example. Although CPU111 can be changed into a sleep state between the latency times to the processing end of such hardware modules M0-Mn, the method poses a problem. [0006] In the case where CPU111 is changed into a sleep state with hardware control, there is a possibility of causing the degradation by execution of useless sleep and the fall of the power consumption curtailment effect. It is because sleep may be carried out although it must be able to carry out the Wake rise immediately after changing CPU111 into a sleep state or CPU111 can be changed into a sleep state, since CPU111 cannot predict operation which should be performed to a degree. Moreover, when it is going to control by hardware strictly the timing which carries out sleep, there is also an overhead of area and power consumption or a problem of becoming large, by the hardware.

[0007] On the other hand, the period which changes CPU111 into a sleep state for CPU111 sleep and when carrying out the Wake rise is beforehand estimated by software control, and the Wake rise is carried out, after pointing to the period by sleep instruction and changing into a sleep state. However, when many sleep periods are estimated, sleep will be carried out to a useless period and degradation will be caused after all. On the contrary, when it estimates few, a clock will be supplied in the period which may be carrying out sleep in practice, and there is a problem that the power consumption curtailment effect falls.

[0008] Made in order that this invention might solve the conventional trouble like \*\*\*\*, the purpose is offering the system LSI and the power management method of raising a low-power-ized effect sharply, avoiding the degradation by execution of sleep with useless CPU. Moreover, the other purposes are offering the system LSI which can attain the increase in efficiency of the low-power design in a system LSI. [0009]

[Means for Solving the Problem] In order to attain the above-mentioned purpose, the feature of the system LSI which is invention according to claim 1 is in the system LSI equipped with one or more hardware modules which perform predetermined processing, and CPU which controls operation of the aforementioned hardware module according to a program to have formed the power management equipment which controls a halt and resumption of clock supply to Above CPU.

[0010] In invention of the claim 1 above-mentioned publication, the feature of the system LSI which is invention according to claim 2 prepares a means execute the sleep instruction for stopping clock supply to Above CPU in Above CPU, and the aforementioned power management equipment is in it for having carried out to the composition which stops the clock supply to Above CPU based on execution of the aforementioned sleep instruction by Above CPU.

[0011] In invention of the claim 2 above-mentioned publication, the aforementioned power management equipment has the feature of the system LSI which is invention

according to claim 3 in having made it the composition which resumes the clock supply to Above CPU in response to the end of processing of the aforementioned hardware module.

[0012] In invention of the claim 3 above-mentioned publication, the aforementioned sleep instruction has the 1st field which specifies by the end of processing of which hardware module the clock supply to Above CPU is resumed, and the feature of the system LSI which is invention according to claim 4 is in the aforementioned power management equipment for having carried out to the composition which resumes the clock supply to Above CPU with reference to the content of the 1st field of the above. [0013] Having the 2nd field where the feature of the system LSI which is invention according to claim 5 specifies the register with which the aforementioned sleep instruction stored the value of the 1st field of the above in invention of the claim 4 above-mentioned publication, the aforementioned power management equipment is to have made it the composition in which the clock supply to Above CPU is resumed with reference to the content of the above 1st and the 2nd field.

[0014] The feature of the system LSI which is invention according to claim 6 is in the above-mentioned claim 2 or invention according to claim 5 to have made the routine in the aforementioned program used in order to wait for the end of processing of the aforementioned hardware module the composition automatically transposed to the aforementioned sleep instruction.

[0015] The feature of the power management method which is invention according to claim 7 To the sleep instruction which it performs [instruction] in CPU and stops supply of the clock to this CPU When the content which directs the conditions of the operating state of the hardware module for making supply of the clock to CPU resume is included and CPU executes the aforementioned sleep instruction It is in generating the signal which stops supply of the clock to CPU, after storing the aforementioned conditions in a register, and generating the signal which makes supply of the clock to CPU resume, when the operating state of a hardware module agrees with the aforementioned conditions stored in the aforementioned register.

[Embodiments of the Invention] Hereafter, the gestalt of operation of this invention is explained with reference to a drawing.

[0017] [1st operation gestalt] drawing 1 is the block diagram showing the composition of the system LSI concerning the 1st operation gestalt of this invention.

[0018] The fundamental composition of this system LSI has the composition of having added the power management module 20 which had sleep and a function for carrying out the Wake rise for CPU11, in the same system LSI (drawing 20) as the former equipped with CPU11, the hardware modules M0-Mn of plurality (one [or]), and the memory 12 that stores a program and data.

[0019] although a clock is supplied to CPU11 through this power management module 20, a partial circuit with the need of always supplying the clock is resembled as usual, and a clock is supplied to it Furthermore, an addition and change of a function are added to CPU11 so that the sleep instruction for changing CPU11 into a sleep state can be decoded and executed in addition to the conventional instruction set.

[0020] In addition to the operation code OP showing a sleep instruction, the instruction

code of a sleep instruction gives the Wake rise module field WU and the condition field CO, as shown in drawing 2. The Wake rise module field WU is the field which specifies whether the Wake rise of CPU11 is carried out, when processing of which hardware modules M0-Mn is completed (the hardware module specified to be this appearance is hereafter called Wake rise module). It enables it to specify one or more hardware modules to be the Wake rise module fields WU by giving the bit corresponding to each hardware module. The condition field CO will specify (it is hereafter called OR conditions) for whether the Wake rise of CPU11 is carried out, if either (it being hereafter called AND conditions) or those processings end whether the Wake rise of CPU11 will be carried out if all of those processings are completed when two or more modules in the Wake rise module field WU are specified.

[0021] For example, in a system LSI with five hardware modules M0, M1, M2, M3, and M4, when processing of both hardware modules M0 and M2 is completed, the sleep instruction in the case of carrying out the Wake rise of CPU11 comes to be shown in

drawing 3.

[0022] However, bit width of face of an instruction is made into 32 bits, and 1 bit is assigned to the condition field CO and, in the case of AND conditions, in the case of "0" and OR conditions, it is made into "1." Moreover, the Wake rise module field WU corresponded to hardware modules M0-M4 sequentially from the least significant bit, and when the bit corresponding to each hardware modules M0-M4 was "1", the hardware module should be specified as a Wake rise module.

[0023] A sleep instruction uses it in the program in the conventional system LSI, replacing with the routine (it is hereafter called the waiting routine for a hardware processing end) only for waiting for the end of processing of a hardware module. For example, suppose that there was a routine as shown in drawing 4 by the program of the conventional system LSI. Here, mfc is taken as the instruction which loads the content of the register for hardware module control to a general-purpose register. Moreover, by state's being the register which stores the operating state of a hardware module, and corresponding to hardware modules M0-M4 from a least significant bit, respectively, if a certain bit is "1", the hardware module corresponding to the bit shall express that processing is under execution.

[0024] This waiting routine for a hardware processing end performs the following processings. First, the content of \$state is loaded to a general-purpose register r2. Next, only the operating state of hardware modules M1 and M3 is extracted by performing the AND operation of "r2" and "0x0005." Then, comparison of "r2" and "r0 (for the content, "0" is always a register)" is performed, and if both are not equal, it branches to the instruction which a label called Loop attached, i.e., the first mfc instruction. Since it is that CPU11 does not perform the next processing until processing of hardware modules M0 and M2 ends this, the sleep of CPU11 can be carried out in the meantime. Then, by replacing this routine by one sleep instruction of drawing 3, while waiting for the processing end of hardware modules M0 and M2, the sleep of CPU11 is carried out. Power consumption is not only reducible, but program length can be shortened by this. [0025] Drawing 5 is the block diagram showing the composition of the power

21, the Wake rise module register 22, a m dule state flag register 23, a sleep control flip-flop 24, and the OR gate 25.

[0026] The sleep control flip-flop 24 is a flip-flop for controlling supply of the clock to CPU11, and reset-signal RTF is inputted for the set signal STF from a comparator 21 from CPU11 again.

[0027] The input of the OR gate 25 is the clock creatine kinase (it is hereafter called a main clock) currently supplied to CPU11 with the output OUT of the sleep control flip-flop 24, and the composition of the conventional system LS 1, and an output serves as the clock CLK supplied to CPU11. The module state flag register 23 is a register for supervising the operating state of a hardware module, and is giving the bit corresponding to each hardware module. CPU11 sets the value of this register and each hardware module resets it. When CPU11 of the conventional system LSI has the register which has an equivalent function, it can substitute for this register. The Wake rise module register 22 is a register which stores the value of the Wake rise module field WU in sleep instruction code, and when CPU11 decodes / executes a sleep instruction, it transmits a storing value. A comparator 21 is a circuit for detecting the timing which carries out the Wake rise module register 22, the value of the module state flag register 23, the value of the Wake rise module register 22, the value of the condition field CO in sleep instruction code, and interrupt signal BR are inputted, and reset-signal RTF is outputted to the sleep control flip-flop 24 with those values.

[0028] Operation of the system LSI of this operation gestalt is explained.

[0029] When an initial state, i.e., a system LSI, is reset, interrupt signal BR (reset interruption) is inputted into a comparator 21. Since the sleep control flip-flop 24 is reset by this and the output OUT of the sleep control flip-flop 24 is set to "0" by it, Clock CLK is supplied to CPU11. CPU11 sets the bit corresponding to the hardware module in the module state flag register 23 at the same time it gives a processing instruction to a certain hardware module.

[0030] Next, execution of a sleep instruction transmits the value of the Wake rise module field WU in sleep instruction code, and the value of the condition field CO to the Wake rise module register 22 and comparator 21 of the power management module 20, respectively. Moreover, the sleep control flip-flop 24 is set and the output OUT is set to "1."

[0031] If the output OUT of the sleep control flip-flop 24 which is one of the inputs of the OR gate 25 is set to "1", the output CLK of the OR gate 25, i.e., the clock signal to CPU11, will not be concerned with the value of the main clock creatine kinase which is another input, but it will be set to "1." That is, since it means that supply of the clock CLK to CPU11 was stopped, CPU11 will be in a sleep state.

[0032] Each hardware modules M0-M4 reset the bit corresponding to the hardware module of the module state flag register 23, after the given processing is completed. The comparator 21 is always comparing the value of the module state flag register 23 and the Wake rise module register 22, and when the result satisfies the conditions given in the condition field CO of sleep instruction code, it outputs reset-signal RTF to the sleep control flip-flop 24. Moreover, when interrupt signal BR is inputted, it is not concerned with a comparison result but reset-signal RTF is outputted.

[0033] If the sleep control flip-flop 24 is reset, since the output OUT of this flip-flop 24 will be set to "0", the main clock creatine kinase which is another input of the OR gate

25 is transmitted to the output CLK of the OR gate 25 as it is. Supply of the clock CLK to CPU11 is resumed by this, and CPU11 carries out the Wake rise by it. [0034] The system LSI which carried three hardware modules M0, M1, and M2 as shown in drawing 6 is made into an example, and above-mentioned operation is explained still more concretely.

[0035] Drawing 7 is the circuit diagram showing the example of composition of the comparator 21 in the power management module 20 in this example. each bit of the module state flag register 23 here corresponding to hardware modules M0, M1, and M2, and the Wake rise module register 22 -- respectively (S0, S1, S2) -- and (W0, W1, W2) -- \*\* -- it carries out It is shown that the hardware module corresponding to them is processing performing (S0, S1, S2) when a value is "1", and (W0, W1, W2) shall show that the hardware module corresponding to them was specified as a Wake rise module, when a value is "1."

[0036] If a processing instruction is taken out from CPU11 to a hardware module M1, it will become = (S0, S1, S2) (1, 0, 0). Moreover, if a processing instruction is also given to a hardware module M2 while the hardware module M0 is performing processing, it will become = (S0, S1, S2) (1, 0, 1). Then, if the sleep instruction of drawing 8 to which the sleep of CPU11 is carried out till the processing end of both hardware modules M0 and M2 is decoded / executed, "0" as which (1, 0, 1) express AND conditions in a comparator 21 to (W0, W1, W2) will be transmitted first, respectively.

[0037] Next, CPU11 will be in a sleep state by inputting the set signal STF into the sleep control flip-flop 24. Within the comparator 21, the value of (S0, S1, S2), and (W0, W1, W2) is compared by the combinational circuit (AND condition block 21a, OR condition block 21b). Since AND conditions are specified by the sleep instruction, the output of AND condition block 21a is chosen by multiplexer 21c.

[0038] In AND condition block 21a, the bit corresponding to the hardware modules M0, M1, and M2 of the module state flag register 23 and the Wake rise module register 22 is inputted into NAND gates AC0, AC1, and AC2, respectively. (S0, S1, S2) The output of AND-gate AC3 to which these values are considered as an input at the time of = (1, 0, 1)and = (W0, W1, W2) (1, 0, 1) since the outputs of NAND gates AC0, AC1, and AC2 are "0", "1", and "0", respectively is set to "0." Since it is W1=0, it is not concerned with the value of S1, i.e., the operating state of a hardware module M1, but the output of NAND gate AC1 is always set to "1." That is, only the operating state of the hardware module specified as a Wake rise module influences the output of AND-gate AC3. [0039] Since the output of NAND gate AC2 is "0" even if processing of a hardware module M0 is completed, it is set to S0=0 and the output of NAND gate AC0 is set to "1", the output of AND-gate AC3 is still "0." If processing of a hardware module M2 is also ended and it is set to S2=0, the output of NAND gate AC2 will be set to "1." NAND gates AC0, AC1, and AC2 - if all outputs are set to "1", the output of AND-gate AC3 will be set to "1" Since the output of AND-gate AC3 is chosen by multiplexer 21c, the output of multiplexer 21c is set to "1." Since it is the output of multiplexer 21c, and the input whose interrupt signal BR is 21d of OR gates, when interrupt signal BR is not inputted, the output of AND-gate AC3 is transmitted to the output which is 21d of OR gates as it is. Since this becomes the output of a comparator 21, i.e., reset-signal RTF, when processing of both hardware modules M0 and M2 is completed, reset-signal RTF

is set to "1." If the sleep control flip-flop 24 is reset by this reset-signal RTF and the output OUT is set to "0" by it, the value of the main clock creatine kinase will be transmitted to the output of the OR gate 25 as it is, and supply of the clock CLK to CPU11 will be resumed.

[0040] Next, the case where the sleep instruction of drawing 9 to which the sleep of CPU11 is carried out till the end of a hardware module M0 or processing of M2 is executed is explained.

[0041] Since OR conditions are specified by the sleep instruction, the output of OR condition block 21b is chosen by multiplexer 21c. In OR condition block 21b, the bit corresponding to M0, M1, and M2 of the module state flag register 23 and the Wake rise module register 22 is inputted into the AND gates OC0, OC1, and OC2, respectively. However, the value by which the value of the module state flag register 23 was reversed is inputted. (S0, S1, S2) The output of OR-gate OC3 to which these values are considered as an input at the time of = (1, 0, 1) and = (W0, W1, W2) (1, 0, 1) since the outputs of the AND gates OC0, OC1, and OC2 are "0", "0", and "0", respectively is set to "0." since it is W1=0 — the value of S1, i.e., the operating state of a hardware module M1, — not being concerned — the output of AND-gate OC1 — "0" — always — \*\* — it becomes That is, only the operating state of the hardware module specified as a Wake rise module influences the output of OR-gate OC3.

[0042] If processing of a hardware module M0 is completed and it is set to S0=0, the output of AND-gate OC0 will be set to "1", and the output of OR-gate OC3 will also be set to "1" by this. This value lets multiplexer 21c and 21d of OR gates pass, and is outputted to the sleep control flip-flop 24 as a reset-signal RTF.

[0043] When interrupt signal BR is inputted, regardless of the output of multiplexer 21c, the output of 21d of OR gates is set to "1", and reset-signal RTF will be outputted to the sleep control flip-flop 24.

[0044] Here, although only AND conditions and OR conditions explained composition and operation for the conditions which carry out the Wake rise of CPU11, the circuit of a condition block is added and other condition logic can be realized by using two or more bits for the condition field CO of sleep instruction code.

[0045] Moreover, even if it carries out the Wake rise of CPU11 or processing of which hardware module is completed by the processing end of a specific hardware module, in carrying out the Wake rise of CPU11, a comparator 21, the Wake rise module register 22, and the module state flag register 23 become unnecessary. What is necessary is just to input into the sleep control flip-flop 24 by setting the result of the OR operation of the processing terminate signal from a hardware module, and interrupt signal BR to resetsignal RTF. The power management module 20 can be simplified by this.

[0046] When interrupt signal BR was inputted and it changes into the state where there is a circuit, using reset-signal RTF being outputted to the sleep control flip-flop 24, it becomes possible to carry out the Wake rise of CPU11. For example, what is necessary is just to make it output interrupt signal BR, when a data bus changed into a predetermined state, the Wake rise of CPU11 was carried out, the circuit which supervises the state of a data bus is added and a data bus changes into the state. [0047] Although the composition which added the power management module 20 to the conventional system LSI explained with this operation form, this is for giving explanation easy and may include this function into CPU11. In this case, it is that a

clock is always supplied to the circuit equivalent to the Wake rise module register 22, the module state flag register 23, and the sleep control flip-flop 24, and same operation can be realized.

[0048] Thus, with this operation form, since the timing to which the sleep of CPU11 is carried out was controlled by software (sleep instruction), it can determine when a programmer carries out the sleep of CPU11, and it becomes possible to avoid the degradation by execution of useless sleep. Furthermore, only a suitable period becomes possible [ carrying out sleep ] by controlling the Wake rise of CPU11 by hardware, without predicting a sleep period. It becomes possible to raise a low-power-ized effect sharply, this avoiding the degradation by execution of useless sleep. Moreover, since the power management module 20 which realizes these functions can be mounted by very easy hardware, its overhead of the area by this and power consumption is also small. [0049] Since the waiting routine for a hardware module processing end which consisted of two or more instructions is transposed to one sleep instruction, the amount of memory which is needed since a program is stored becomes small, and the number of instructions performed also becomes less than the conventional program. Furthermore, since instruction memory is not accessed while CPU is carrying out sleep, the sleep also of the instruction memory can be carried out in the meantime. The power consumption of instruction memory is also cut down by these things.

[0050] The 2nd operation form of the [2nd operation form] this invention is explained with reference to drawing 10, drawing 11, and drawing 12.

[0051] In the system LSI shown in drawing 1 with five hardware modules M0, M1, M2, M3, and M4, the case where it is expressed with a flow chart as a part of program performed shows to drawing 10 is considered. Here, suppose that a processing instruction is taken out with processing 1.1, processing 1.2, processing 2.1, processing 2.2, and processing 3 to hardware modules M0, M1, M2, M3, and M4, respectively. Since the waiting routine for a hardware module processing end is after processing 3 is completed, by transposing this to a sleep instruction, the sleep of CPU11 is carried out and curtailment of power consumption is aimed at.

[0052] However, supposing it waits to complete processing of all hardware modules in which this routine was able to give the processing instruction in the performed processing, in the sleep instruction code of drawing 2, it is unrealizable. In the sleep

instruction of drawing 2, since conditional branching occurs by this program to presuming the Wake rise instruction clearly, it is because the hardware module which has a processing instruction issued is not determined as 1 set.

[0053] Then, the 2nd sleep instruction code shown in drawing 11 is introduced. This sleep instruction code consists of an operation code OP and the one register field RG. One certain register is specified in the register field RG. The contents equivalent to the value of the Wake rise module field WU in the sleep instruction code of drawing 2 and the condition field CO are stored in the register specified here. When decoding and executing this sleep instruction, the Wake rise of CPU11 is controlled by transmitting the value of the register directed in the register field RG to the power management module 20.

[0054] Next, how to change CPU11 into a sleep state is explained with reference to the flow chart of drawing 12 using this sleep instruction.

[0055] The most significant bit of the register specified in the register field RG presupposes that it is equivalent to the condition field CO, and 5 bits is equivalent to the Wake rise module field WU from a least significant bit. Moreover, suppose that a general-purpose register r8 is specified in a sleep instruction.

[0056] In drawing 12, first, before performing processing in connection with sleep operation, it initializes by substituting "0x0000" for "r8." After giving a processing instruction to a hardware module M0 in processing 1.1, an OR operation is performed for the value of "r8", and "0x0001." Similarly, after giving a processing instruction to hardware modules M1, M2, M3, and M4 in processing 1.2, processing 2.1, processing 2.2, and processing 3, the value of "r8" and the OR operation of "0x0002", "0x0004", "0x0008", and "0x0010" are performed, respectively, and the result is stored in "r8." If it is AND conditions and is "0x0000" and OR conditions before executing a sleep instruction in order to specify the value of the condition field CO, the OR operation of "0x8000" and "r8" is performed, respectively.

[0057] When performing processing 1.1 and processing 2.1 and carrying out the Wake rise of CPU11 on AND conditions by doing in this way, the contents of "r8" are set to "0x0015", and sleep operation of carrying out the Wake rise of CPU11 according to the AND conditions of hardware modules M0 and M2 can be realized.

[0058] In addition, since pipeline processing is carried out, there is a case where he wants to make the instruction preceded before a sleep instruction goes into the execution stage completed. For example, when accessing memory 12 by processing by CPU11 and loading/store instruction is left with the access demand from CPU11 coming out, it is the case where it becomes impossible ATASESU [ other modules ]. In this case, a number required before a sleep instruction of NOP instructions are inserted, and a sleep instruction is made to execute after the instruction is completed.

[0059] the [next, / the above 1st and ] — the sleep to CPU11 used for 2 operation forms and the order of the real way of the Wake rise processing are explained with reference to the flow chart of drawing 13

[0060] First, CPU11 decodes the instruction executed next (Step S11), and it judges whether it is the sleep instruction to which the sleep of CPU11 is carried out (Step S12). If it is a sleep instruction, the conditions for carrying out the Wake rise of CPU11 directed by this instruction are stored in a register (Step S13). Furthermore, the signal which stops supply of the clock to CPU11 is generated, and CPU11 carries out sleep with this signal (Step S14).

[0061] While CPU11 is carrying out sleep, after the processing under execution of a certain hardware module is completed, a processing terminate signal is generated (Step S15). It is judged whether the conditions which make the clock supply to stored CPU11 resume were fulfilled (Step S16), if filled by the processing end of the hardware module, the signal which makes supply of the clock to CPU11 resume will be generated by it, and CPU11 will carry out the Wake rise by it (Step S17).

[0062] the [ the [3rd operation form] above 1st and ] — with 2 operation forms, when CPU11 cannot perform the next processing until processing of a certain hardware module is completed, CPU11 is changed into a sleep state with software (sleep

instructi n), and the Wake rise of CPU11 is carried out by the processing terminate signal from the hardware module In this case, the operation code OP to which the sleep instruction code used expresses a sleep instruction, The Wake rise module field WU which specifies by the processing terminate signal from which hardware module the Wake rise of CPU11 is carried out, When two or more hardware modules in the Wake rise module field WU are specified, those AND conditions that will carry out the Wake rise of CPU11 if processing is all completed, And if ones of those processings is completed, it will consist of the condition field CO showing OR conditions which carry out the Wake rise of CPU11. the [ the above 1st and ] — with 2 operation forms, since such sleep instruction code was ungenerable with a compiler, there was fault that the waiting routine for a hardware module processing end had to be transposed to a sleep instruction by the help

[0063] In order to cancel this fault, with the \*\*\*\* 3 operation gestalt, the function which transposes automatically the waiting routine for a hardware module processing end in the conventional program to the aforementioned sleep instruction is prepared. Hereafter, the technique is explained in detail.

[0064] Drawing 14 is drawing showing an example of the waiting routine for a hardware module processing end in the program of a system LSI.

[0065] In this drawing, the value of status-register state of a hardware module is first loaded to a general-purpose register r2 by mfc instruction. Here, each bit of status-register state will be set to "0", if a corresponding hardware module is performing processing and "1" and processing will be ended.

[0066] Then, a mask is covered over the value loaded by andi instruction. Since the 3rd operand of an andi instruction is "0x0003", this has taken out only the operating state of the hardware module (hereafter referred to as M0 and M1, respectively) corresponding to the 0th bit (LSB) of status-register state, and the 1st bit. And a bne instruction performs comparison with the register r0 which is always "0", and if the result is not equal, it already branches to the degree of -, and mfc2 instruction, and if equal, it will escape from the routine. That is, it will be called the routine for which it waits that processing of both hardware modules M0 and M1 ends this routine. [0067] Next, it considers transposing this routine to a sleep instruction.

[0068] Since the Wake rise of CPU11 is carried out by the end of processing of hardware modules M0 and M1 in this example, the Wake rise module field WU of a sleep instruction is set to "0x0003." Moreover, if processing of all the hardware modules specified at both hardware modules M1 [ M0 and ] WU, i.e., the Wake rise module field, is completed, since the Wake rise of CPU11 will be carried out, the value of the condition field CO serves as AND conditions. Therefore, a corresponding sleep instruction comes to be shown in drawing 15. Here, as for the value of "111111" and the condition field CO, "0" and OR conditions set [ AND conditions ] the operation code OP showing a sleep instruction to "1."

[0069] Another example of the waiting routine for a hardware module processing end is shown in drawing 16. In this example, first, "0x0003" is substituted for the register r3, and this is used as a mask by the next and instruction of mfc2 instruction. When the value of status-register state over which the mask was covered is the same as r3 (i.e., when having ended neither of hardware modules M0 and M1 of the processings),

branching is materialized, and when it differs (i.e., when one processing of the hardware modules M0 or M1 is completed), it escapes from this routine. That is, this routine is a routine for waiting to complete one processing of the hardware modules M0 or M1. Therefore, when this routine is transposed to a sleep instruction, it comes to be shown in

drawing 17. Here, the value of the Wake rise module field WU is "0x0003" which shows hardware modules M0 and M1, and since the condition field CO carries out the sleep of CPU11 until one processing of the hardware modules M0 or M1 is completed, it serves as OR conditions.

[0070] In a compiler, a sleep instruction is automatically generable by transposing the procedure which generates such an instruction sequence to the procedure which generates a sleep instruction.

[0071] Next, the procedure for transposing the waiting routine for a hardware module processing end to a sleep instruction is explained with reference to drawing 18 and

# drawing 19.

[0072] In the flow chart of drawing 18, a source code is first changed into an assembly code with a compiler (Step S21). Next, a hardware module processing end \*\*\*\* routine is changed into a sleep instruction by filtering this (Step S22). When the changed assembly code assembles at the end, a machine language including a sleep instruction is generated (Step S23).

[0073] A translation table is used for filtering at Step S22. The sleep instruction corresponding to the instruction sequence which has realized the waiting routine for a hardware module processing end, and its instruction sequence constructs a translation table, and it consists of \*\*\*\*\*\*. A constant and a variable express the operand of an instruction sequence. The example of the translation table for changing the instruction sequence of drawing 14 and drawing 15 into a sleep instruction at drawing 19 is shown.

[0074] In drawing 19, a declaration of a variable and a constant is made first. Here, state below \$const, and r0, and and or are constants, and reg1, reg2, imm1, and imm2 below \$var are a variable. LABEL1 and LABE2 below \$label are a special variable for the judgment with a branching place in agreement (it is hereafter called a label variable). The portion surrounded by \$table and \$endtable is the actual condition of a translation table, and below \$stream in this is the format of the sleep instruction which an instruction sequence and below \$format change.

[0075] Furthermore, the procedure of filtering is explained. The filter performs comparison with the instruction sequence of a translation table sequentially from the beginning of an assembly code. Comparison is performed as follows. First, it judges whether an operation code OP is in agreement. If in agreement, it will judge whether next an operand is in agreement. In this case, the operand given as a constant by the translation table compares as it is. When substituting the value of the operand of an assembly code in the case of the first comparison performed using the variable and performing comparison with the variable next at it, it compares with the operand given as a variable using the substituted value. If both are in agreement as a result of comparison, the instruction sequence in an assembly code will be replaced according to the format of the sleep instruction to which it was given by \$format.

[0076] When there is a hardware module processor-limited routine as shown in a certain acene pulley code at drawing 14 hereafter, the procedure at the time of changing this into a sleep instruction by the translation table shown in drawing 19 is explained concretely.

1

[0077] Since "LABEL1:" appeared in the assembly code, the position of this label is stored. Next, since there is mfc2 instruction and this is in agreement with the instruction of the beginning of the instruction sequence in a translation table, the operand is compared. Since the first operand of the mfc2 instruction in a translation table is a variable of reg1, the value r2 of the first operand of the mfc2 instruction in an assembly code is substituted for this. Since the second operand of mfc2 instruction of a translation table is a constant, it compares as it is.

[0078] Since the mfc instruction of an operand corresponds, the next instruction is compared. Since both are in agreement by and instruction, a first operand is compared. Since the first operand of an andi instruction of a translation table is a variable reg2, the first operand r2 of the andi instruction in an assembly code is substituted for this.

[0079] Since the second operand of an andi instruction of a translation table is reg1 of existing appearance, it is compared using r2 previously substituted for this variable. "0x0003" is substituted for imm1 by comparison of the 3rd operand. In comparison of the next bne instruction, a second operand is the same.

[0080] Since LABEL1 of the 3rd operand of a bne instruction of a translation table is a label variable, it judges whether the label and branching place of the 3rd operand of the bne instruction in an assembly code are the same. Since both sides have branched to the mfc2 instruction in the case of this example, it is in agreement. Since it was altogether in agreement with the instruction sequence of a translation table, the instruction sequence in an assembly code is transposed to a sleep instruction according to the format to which it was given by \$format. Since imm1 is a variable in the case of this example, "0x0003" substituted at the time of comparison of an andi instruction is used. [0081] Thus, with this operation gestalt, since the instruction sequence which was a waiting routine for a hardware module processing end in the conventional program can be automatically transposed to a sleep instruction, the effort of the part and a programmer is decreased and it becomes possible to attain the increase in efficiency of the low-power design in a system LSI.

[Effect of the Invention] It becomes possible to attain low-power-ization, avoiding the degradation by execution of useless sleep according to the system LSI which is invention according to claim 1 to 4, since a halt (sleep) of the clock supply to CPU is controllable by software (sleep instruction), as explained to the detail above. Furthermore, it becomes possible by controlling resumption (Wake rise) of the clock supply to CPU by hardware to raise a low-power-ized effect sharply, being able to carry out the sleep only of the suitable period and avoiding the degradation by execution of useless sleep without predicting a sleep period. Moreover, since the power management equipment which realizes these functions can be mounted by very easy hardware, its overhead of the area by this and power consumption is also small. Moreover, since the real line count of an instruction becomes less than the conventional program by transposing the waiting

routine for a hardware module processing end which exists in the conventional program to one sleep instruction, the power consumption by memory access is also reducible. Furthermore, since two or more instructions are transposed to one instruction, the amount of memory which is needed since a program is stored als becomes small. [0083] According to the system LSI which is invention according to claim 5, a sleep instruction

(19) 日本国特許庁 (J P)

# (12) 公開特許公報(A)

(11)特許出顧公開番号

特開2000-112585 (P2000-112585A)

(43)公開日 平成12年4月21日(2000.4.21)

| (51) Int.CL |      | 識別配号 | · <b>F</b> I |      |         | テーマコード( <del>参考</del> ) |
|-------------|------|------|--------------|------|---------|-------------------------|
| G06F        | 1/32 |      | G06F         | 1/00 | 3 3 2 Z | 5B011                   |
|             | 1/26 |      |              | 1/04 | 301C    | 5B079                   |
|             | 1/04 | 301  |              | 1/00 | 330C    |                         |

#### 審査請求 未請求 請求項の数9 OL (全 13 頁)

| (21)出顧番号 | 特顧平10-281610          | (71)出顧人 000003078             |
|----------|-----------------------|-------------------------------|
|          |                       | 株式会社東芝                        |
| (22)出願日  | 平成10年10月2日(1998.10.2) | 神奈川県川崎市幸区堀川町72番地              |
|          |                       | (72)発明者 河邉 直之                 |
|          |                       | 神奈川県川崎市幸区堀川町580番1号 株          |
|          |                       | 式会社東芝半導体システム技術センター内           |
|          |                       | (72)発明者 宇佐美 公良                |
|          |                       | 神奈川県川崎市幸区福川町580番1号 株          |
|          |                       | 式会社東芝半導体システム技術センター内           |
|          |                       | (74)代理人 100083806             |
|          |                       | 弁理士 三好 秀和 (外7名)               |
|          |                       | Fターム(参考) 58011 EA08 EB00 LL12 |
|          |                       | 58079 AA07 BA12 BB02 BC01     |
|          |                       |                               |

## (54) 【発明の名称】 システムLSI及びパワーマネジメント方法

#### (57)【要約】

【課題】 CPUの無駄なスリーブの実行による性能低 下を避けつつ低消費電力化効果を大幅に向上させること ができるシステムLSIを提供する。

【解決手段】 所定の処理を実行する1つまたは複数の ハードウェアモジュールと、前記ハードウェアモジュー ルの動作をプログラムに従って制御するCPUとを備え たシステムLSIにおいて、前記CPUに対するクロッ ク供給の停止及び再開を制御するパワーマネジメント装 置を設ける。すなわち、CPUに対するクロック供給の 停止を行うためのスリープ命令を実行する手段をCPU に設け、前記パワーマネジメント装置は、CPUによる 前記スリープ命令の実行に基づいて、CPUに対するク ロック供給を停止すると共に、記ハードウェアモジュー ルの処理の終了を受けて、CPUに対するクロック供給 を再開する構成にする。



## 【特許請求の範囲】

i

1

【 請求項 1 】 所定の処理を実行する 1 つまたは複数の ハードウェアモジュールと、前記ハードウェアモジュー ルの動作をプログラムに従って制御するCPUとを備え たシステムLSIにおいて、

前記CPUに対するクロック供給の停止及び再開を制御 するパワーマネジメント装置を設けたことを特徴とする システムLSI。

【請求項2】 前記CPUに対するクロック供給の停止 を行うためのスリープ命令を実行する手段を前記CPU 10 に設け、

前記パワーマネジメント装置は、前記CPUによる前記 スリープ命令の実行に基づいて、前記CPUに対するク ロック供給を停止する構成にしたことを特徴とする請求 項1記載のシステムLSI。

【請求項3】 前記パワーマネジメント装置は、前記ハ ードウェアモジュールの処理の終了を受けて、前記CP Uに対するクロック供給を再開する構成にしたことを特 徴とする請求項2記載のシステムLSI。

モジュールの処理の終了によって前記CPUに対するク ロック供給を再開するかを指定する第1のフィールドを 有し.

前記パワーマネジメント装置は、前記第1のフィールド の内容を参照して前記CPUに対するクロック供給を再 開する構成にしたことを特徴とする請求項3記載のシス FALS 1.

【請求項5】 前記スリーブ命令は、前記第1のフィー ルドの値を格納したレジスタを指定する第2のフィール ドを有し、

前記パワーマネジメント鉄置は、前記第1と第2のフィー ールドの内容を参照して前記CPUに対するクロック供 給を再開する構成にしたことを特徴とする請求項4記載 のシステムLSI。

【請求項6】 前記ハードウェアモジュールの処理の終 了を待つために用いられる前記プログラム中のルーチン を前記スリープ命令に自動的に置き換える構成にしたこ とを特徴とする論求項2乃至請求項5記載のシステムし SI.

【請求項7】 前記CPUに接続されたメモリを有し、 前記パワーマネジメント装置は、前記CPUへのクロッ ク供給の停止時に前記メモリへのクロック供給を停止 し、且つ前記CPUへのクロック供給の再開時に前記メ モリへのクロック供給を再開する構成にしたことを特徴 とする請求項1乃至請求項6記載のシステムLSI。

【請求項8】 前記メモリは、前記CPU、前記ハード ウェアモジュール及び前記パワーマネジメント装置と同 一のチップ上に形成したことを特徴とする請求項7記載 のシステムLSI。

ロックの供給を停止させるスリープ命令に、CPUへの クロックの供給を再開させるためのハードウェアモジュ ールの動作状態の条件を指示する内容を含めておき、 CPUが前記スリープ命令を実行したときに、前記条件 をレジスタに铬钠してからCPUへのクロックの供給を 停止させる信号を生成し、

ハードウェアモジュールの動作状態が、前記レジスタに 格納された前記条件と台致したときに、CPUへのクロ ックの供給を再開させる信号を生成することを特徴とす るパワーマネジメント方法。

#### 【発明の詳細な説明】

[0001]

【発明の属する技術分野】本発明は、チップ上にCPU と1つまたは複数のハードウェアモジュールを搭載した システムLSI、及びその低消費電力化を実現するパワ ーマネジメント方法に関する。

[0002]

【従来の技術】一般に、従来のシステムLSIは、図2 0に示すように、チップ上にCPU1111と、複数のハ 【論水項4】 前記スリーブ命令は、どのハードウェア 20.ードウェアモジュールM0、M1,…、Mne.命令や データを格納するメモリ112とを搭載した構成となっ ている。CPUIIIは、それ自身が行う処理のほか に、ハードウェアモジュールMO~Mnに対して処理命 令を出す。ハードウェアモジュールMO〜Mnの動作状 醸. つまり与えられた処理を実行中であるか、与えられ た処理の実行が終了して次の処理命令の待機中である か、あるいはスリープ中であるかといった動作状態は、 CPU111によって監視されている。

> 【0003】かかるシステムLSIの低消費電力化に関 30 しては、例えば次のような技術が提案されている。

- (1)あるハードウェアモジュールM0~Mnが卧作し ていなくてもよい期間には、CPU111は、そのハー ドウェアモジュールMO~Mnへのクロックの供給を停 止して、該ハードウェアモジュールMO~Mnをスリー プ状態にすることにより、低消費電力化を図る。(2) ハードウェアモジュールMO~Mn自身が、与えられた 処理を終了したら自動的にスリーブ状態にすることによ って、低消費電力化を図る。

[0004]

【発明が解決しようとする課題】しかしながら、従来の システムLSIの低消費電力化に関しては、CPUによ って消費される電力がチップ全体で消費される電力の多 くを占めており、CPUの低消費電力化が重要な課題と なっている。

【0005】とのような観点から、CPU111をスリ ープ状態にする手法として、次のようなことが考えられ る。CPU111をスリープ状態にすることができる期 間としては、例えば、ハードウェアモジュールMO~M nが行った処理の結果を用いてCPUlllが次の処理

【論求項9】 CPUにおいて実行され該CPUへのク 50 を行う場合などのように、データ依存などの関係から、

ハードウェアモジュールMO~Mnが所定の与えられた 処理を終了するまでCPU111が次の処理を実行でき ない期間がある。そのようなハードウェアモジュールM ()~Mnの処理終了までの待ち時間の間はCPU111 をスリーブ状態にすることができるが、その方法が問題 となる。

【0006】ハードウェア制御によってCPU111を スリーブ状態にする場合では、無駄なスリーブの実行に よる性能低下や、消費電力削減効果の低下を招く恐れが 測できないために、CPU1111をスリーブ状態にした 直後にウェイクアップしなければならなかったり、CP Ullleスリーブ状態にすることができるのにスリー プさせなかったりすることがあるからである。 また、ハ ードウェアでスリープさせるタイミングを厳密に制御し ようとすると、そのハードウェアによって面積及び消費 電力のオーバヘッドか大きくなるという問題もある。

【0007】一方、ソフトウェア制御によってCPU1 11をスリープ及びウェイクアップする場合は、CPU 期間をスリープ命令によって指示してスリーブ状態にし た後にウェイクアップする。しかし、スリーブ期間を多 く見憤もると、無駄な期間にスリープすることになり、 結局、性能低下を招くことになる。逆に、少なく見積も ってしまうと、実際はスリーブしていてよい期間にクロ ックを供給することになり、消費電力削減効果が低下す るという問題がある。

【0008】本発明は、上述の如き従来の問題点を解決 するためになされたもので、その目的は、CPUの無駄 なスリーブの実行による性能低下を避けつつ低消費電力 化効果を大幅に向上させることができるシステムLSI 及びパワーマネジメント方法を提供することである。ま たその他の目的は、システムLSIにおける低消費電力 設計の効率化を図ることができるシステムLSIを提供 することである。

#### [0009]

【課題を解決するための手段】上記目的を達成するため に、 請求項 1 記載の発明であるシステムLSIの特徴 は、所定の処理を実行する1つまたは複数のハードウェ アモジュールと、前記ハードウェアモジュールの動作を 40 プログラムに従って制御するCPUとを備えたシステム LSIにおいて、前記CPUに対するクロック供給の停 止及び再開を制御するパワーマネジメント装置を設けた ことにある。

【0010】請求項2記載の発明であるシステムしS1 の特徴は、上記論求項1記載の発明において、前記CP Uに対するクロック供給の停止を行うためのスリープ命 令を実行する手段を前記CPUに設け、前記パワーマネ ジメント装置は、前記CPUによる前記スリープ命令の 実行に基づいて、前記CPUに対するクロック供給を停 50 止する構成にしたことにある。

【りり11】請求項3記載の発明であるシステムしSI の特徴は、上記論求項2記載の発明において、前記パワ ーマネジメント装置は、前記ハードウェアモジュールの 処理の終了を受けて、前記CPUに対するクロック供給 を再開する構成にしたことにある。

【0012】 論求項4記載の発明であるシステムしSI の特徴は、上記論求項3記載の発明において、前記スリ ープ命令は、どのハードウェアモジュールの処理の終了 ある。なぜなら、CPU111が次に行うべき動作を予 10 によって前記CPUに対するクロック供給を再開するか を指定する第1のフィールドを有し、前記パワーマネジ メント装置は、前記第1のフィールドの内容を参照して 前記CPUに対するクロック供給を再開する構成にした ことにある。

【0013】論求項5記載の発明であるシステムLSI の特徴は、上記請求項4記載の発明において、前記スリ ープ命令は、前記第1のフィールドの値を格納したレジ スタを指定する第2のフィールドを有し、前記パワーマ ネジメント装置は、前記第1と第2のフィールドの内容 111をスリーブ状態にする期間を予め見積もり、その 20 を参照して前記CPUに対するクロック供給を再開する 構成にしたことにある。

> 【0014】 請求項6記載の発明であるシステムしSI の特徴は、上記請求項2乃至請求項5記載の発明におい て、前記ハードウェアモジュールの処理の終了を待つた めに用いられる前記プログラム中のルーチンを前記スリ ープ命令に自動的に置き換える構成にしたことにある。 【0015】 請求項7記載の発明であるパワーマネジメ ント方法の特徴は、CPUにおいて実行され該CPUへ のクロックの供給を停止させるスリープ命令に、CPU へのクロックの供給を再開させるためのハードウェアモ ジュールの動作状態の条件を指示する内容を含めてお き、CPUが前記スリープ命令を実行したときに、前記 条件をレジスタに格納してからCPUへのクロックの供 給を停止させる信号を生成し、ハードウェアモジュール の動作状態が、前記レジスタに格納された前記条件と台 致したときに、CPUへのクロックの供給を再開させる 信号を生成することにある。

[0016]

【発明の実施の形態】以下、図面を参照して本発明の実 施の形態を説明する。

【0017】[第1実施形態]図1は、本発明の第1実 施形態に係るシステムLSIの構成を示すプロック図で

【0018】このシステムしSIの基本的な構成は、C PU11と、複数(または1つ)のハードウェアモジュ ールM()~Mnと、プログラムやデータを格納するメモ リ12とを備えた従来と同様のシステムLSI(図2 0) において、CPU11をスリープ及びウェイクアッ プさせるための機能を持ったパワーマネジメントモジュ ール20を加えた構成となっている。

【0019】CPU11には、このパワーマネジメント モジュール20を介してクロックを供給するが、常にク ロックを供給している必要のある部分回路には、従来通 りにクロックが供給されるようになっている。さらに、 CPUllには、従来の命令セットに加え、CPUll をスリーブ状態にするためのスリーブ命令をデコード且 つ実行できるように、機能の追加及び変更が加えられ る.

【0020】スリープ命令の命令コードは、図2に示す ェイクアップモジュールフィールドWUと、条件フィー ルドCOとを持たせる。ウェイクアップモジュールフィ ールドWUは、どのハードウェアモジュールMO~Mn の処理が終了したらCPU11をウェイクアップさせる かを指定するフィールドである(以下、この様に指定さ れたハードウェアモジュールをウェイクアップモジュー ルと呼ぶ)。ウェイクアップモジュールフィールドWU に、各ハードウェアモジュールに対応したビットを持た せることで、1つまたは複数のハードウェアモジュール を指定することができるようにする。条件フィールドC 20 短縮することができる。 Oは、ウェイクアップモジュールフィールドWUで複数 のモジュールが指定された場合に、それらの処理が全て 終了したらCPU11をウェイクアップさせるのか(以 下、AND条件と呼ぶ)、あるいは、それらの処理のい ずれかが終了したらCPU11をウェイクアップさせる のか(以下、〇R条件と呼ぶ)を指定する。

【0021】例えば、5つのハードウェアモジュールM O. M1, M2、M3, M4を持つシステムしSIにお いて、ハードウェアモジュールMO及びM2の両方の処 のスリープ命令は、図3に示すようになる。

ŧ

ı

1

【0022】ただし、命令のピット幅を32ビットと し、条件フィールドCOに 1 ピットを割当て、AND条 件の場合は"0"、 OR条件の場合は"1"とする。ま た。ウェイクアップモジュールフィールドWUは、最下 位ピットから順に、ハードウェアモジュールMO~M4 に対応しており、各ハードウェアモジュールMO~M4 に対応するピットが "1" のときに、そのハードウェア モジュールがウェイクアップモジュールとして指定され たものとする。

【0023】スリープ命令は、従来のシステムLSIで のプログラムにおいて、ハードウェアモジュールの処理 の終了を待つためだけのルーチン(以下、ハードウェア 処理終了待ちルーチンと呼ぶ)と置き換えて使用する。 例えば、従来のシステムしS | のプログラムで図4に示 すようなルーチンがあったとする。ここで、mfcはハ ードウェアモジュール制御用のレジスタの内容を汎用レ ジスタにロードする命令とする。また、stateはハ ードウェアモジュールの動作状態を铬钠するレジスタ

MO~M4に対応するものとし、あるビットが"1"で あれば、そのビットに対応するハードウェアモジュール が処理を実行中であることを表すものとする。

【0024】このハードウェア処理終了待ちルーチン は、次のような処理を行うものである。まず、\$sta teの内容を、汎用レジスタr2にロードする。次に、 「r2」と「0x0005」のAND選算を行うことに よって、ハードウェアモジュールM1とM3の動作状態 のみを抽出する。その後、「 r 2 」と「 r 0 (常に内容 ように、スリーブ命令を表すオペコードOPに加え、ウ 10 が 10 のレジスタ)」の比較を行い、両者が等しくな ければ、Loopというラベルのついた命令、つまり、 最初のm f c命令に分岐する。これは、ハードウェアモ ジュールMOとM2の処理が終了するまで、CPU11 は次の処理は行わない、ということであるから、この間 は、CPUllはスリープすることができる。そこで、 このルーチンを図3のスリープ命令1つで置き換えるこ とにより、ハードウェアモジュールMO, M2の処理終 了を待つ間はCPU11をスリープさせる。 これによっ て、消費電力を削減できるだけでなく、プログラム長も

> 【0025】図5は、パワーマネジメントモジュール2 0の構成を示すブロック図である。このパワーマネジメ ントモジュール20は、コンパレータ21、ウェイクア ップモジュールレジスタ22、モジュール状態フラグレ ジスタ23、スリープ制御フリップフロップ24. 及び ORゲート25で構成されている。

【0026】スリーブ制御フリップフロップ24は、C PUllへのクロックの供給を制御するためのフリップ フロップであり、CPU11からセット信号STFが、 理が終了したらCPU11をウェイクアップさせる場合 30 またコンパレータ21からリセット信号RTFが入力さ れる.

【0027】〇Rゲート25の入力は、スリーブ制御フ リップフロップ24の出力OUTと、従来のシステムし Slの構成でCPUllに供給されていたクロックCK (以下、メインクロックと呼ぶ)であり、出力はCPU 11に供給されるクロックCLKとなる。モジュール状 懲フラグレジスタ23は、ハードウェアモジュールの動 作状態を監視するためのレジスタであり、各ハードウェ アモジュールに対応したビットを持たせている。このレ 40 ジスタの値は、CPUIIがセットし、各ハードウェア モジュールがリセットする。このレジスタは、従来のシ ステムLSIのCPU11が同等の機能を有するレジス タを持つ場合は、それで代用することができる。ウェイ クアップモジュールレジスタ22は、スリープ命令コー ド中の、ウェイクアップモジュールフィールドWUの値 を铬钠するレジスタであり、CPU11がスリープ命令 をデコード/実行するときに格納値の転送を行う。コン パレータ2 Iは、CPU11をウェイクアップさせるタ イミングを検知するための回路である。モジュール状態 で、最下位ピットからそれぞれハードウェアモジュール 50 フラグレジスタ23の値、ウェイクアップモジュールレ

ジスタ22の値、スリーブ命令コード中の条件フィール FCOの値、及び割込み信号BRが入力され、それらの 値によって、スリープ制御フリップフロップ24に対し てリセット信号RTFを出力する。

【0028】本実施形態のシステムし51の動作につい て説明する。

【0029】初期状態、すなわちシステムLSIがリセ ットされたときには、コンパレータ21に割込み信号B R(リセット割込み)が入力される。これによって、ス リーブ制御フリップフロップ24の出力〇UTが"0" になるため、CPU11にクロックCLKが供給され る。CPU11は、あるハードウェアモジュールに処理 命令を出すと同時に、モジュール状態フラグレジスタ2 3中の、そのハードウェアモジュールに対応するビット をセットする。

【0030】次にスリーブ命令を実行すると、スリープ 命令コード中のウェイクアップモジュールフィールドW Uの値と条件フィールドCOの値が、それぞれパワーマ ネジメントモジュール20のウェイクアップモジュール 20 ェアモジュールM0とM2の両方の処理終了までCPU レジスタ22とコンパレータ21に転送される。また、 スリープ制御フリップフロップ24がセットされ、その 出力OUTが ~1~ となる。

【0031】ORゲート25の入力の1つであるスリー ブ制御フリップフロップ24の出力OUTが ~1~ とな ると、ORゲート25の出力、すなわち、CPUllへ のクロック信号CLKが、もう一方の入力であるメイン クロックCKの値に関わらず、"1"となる。つまり、 CPU11へのクロックCLKの供給が停止されたこと になるので、CPU11はスリーフ状態となる。

【0032】各ハードウェアモジュールMO~M4は、 与えられた処理が終了すると、モジュール状態フラグレ ジスタ23の、そのハードウェアモジュールに対応した ビットをリセットする。コンパレータ21は、モジュー ル状態フラグレジスタ23とウェイクアップモジュール レジスタ22の値とを常に比較しており、その結果が、 スリープ命令コードの条件フィールドCOで与えられた 条件を満足した場合に、スリープ制御フリップフロップ 24に対してリセット信号RTFを出力する。また、割 込み信号BRが入力された場合は、比較結果に関わらず 40 リセット信号RTFを出力する。

【0033】スリープ制御フリップフロップ24がリセ ットされると、このフリップフロップ24の出力〇UT が "O" となるため、ORゲート25のもう一つの入力 であるメインクロックCKが、ORゲート25の出力C LKにそのまま伝達される。これによって、CPUll へのクロックCLKの供給が再開され、CPUllがウ ェイクアップする。

【0034】図6に示すような、3つのハードウェアモ

例にして、上述の動作をさらに具体的に説明する。 【0035】図7は、本例におけるパワーマネジメント モジュール20内のコンパレータ21の構成例を示す回 路図である。ここで、ハードウェアモジュールMO, M 1、M2に対応するモジュール状態フラグレジスタ23 及びウェイクアップモジュールレジスタ22の各ピット を. それぞれ (SO, S1、S2) 及び (WO, W1, W2)とする。(S(), S1, S2)は値が "1" のと きに、それらに対応するハードウェアモジュールが処理 リーブ制御フリップフロップ24がリセットされて、ス 10 実行中であることを示し (WO, W1, W2) は値が "1"のときに、それらに対応するハードウェアモジュ ールがウェイクアップモジュールとして指定されたこと を示すものとする。

> 【0036】CPU11からハードウェアモジュールM 1に対して処理命令が出されると、(\$0,\$1.\$ 2) = (1, 0, 0) となる。また、ハードウェアモジ ュールMOが処理を実行しているときに、ハードウェア モジュールM2にも処理命令が出されると、(SO、S 1. 52) = (1, 0, 1) となる。その後、ハードウ 11をスリープさせる図8のスリープ命令がデコード/ 実行されると、まず、(図0、図1、図2)に(1、 ()、1)が、コンパレータ21にAND条件を表す。 "()"が、それぞれ転送される。

【0037】次に、スリープ制御フリップフロップ24 にセット信号STFが入力されることによって、CPU 11がスリープ状態となる。コンパレータ21内では、 (SO, S1、S2) と(WO, W1、W2)の値が組 台せ回路(AND条件ブロック21a、OR条件ブロッ 30 ク21 b) によって比較されている。 スリープ命令によ って、AND条件が指定されているので、マルチプレク サ21cによってAND条件ブロック21aの出力が選 択される。

【0038】AND条件ブロック21aでは、モジュー ル状態フラグレジスタ23とウェイクアップモジュール レジスタ22のハードウェアモジュールM(), M1, M 2に対応するビットが、それぞれNANDゲートAC AC1, AC2に入力される。(S0, S1、S) 2) = (1, 0, 1), (W0, W1, W2) = (1,0、1) のときは、NANDゲートACO, AC1, A C2の出力は、それぞれ "0", "1", "0" である から、これらの値を入力とするANDゲートAC3の出 力は "O" となる。W1=Oであるから、S1の値つま りハードウェアモジュールM1の動作状態に関わらず、 NANDゲートAC1の出力は常に"1"となる。すな わち、ウェイクアップモジュールとして指定されたハー ドウェアモジュールの動作状態だけがANDゲートAC 3の出力に影響する。

【0039】ハードウェアモジュールMOの処理が終了 ジュールM0、M1,M2を搭載したシステムLSIを 50 し.S0=0となって、NANDゲートAC0の出力が

"1"となっても、NANDゲートAC2の出力が \*0 であるから、ANDゲートAC3の出力は \*0\* のままである。ハードウェアモジュールM2の処理も終 了し、S2=0となると、NANDゲートAC2の出力 が「1"となる。NANDゲートACO, AC1、AC 2全ての出力が『1" となると、ANDゲートAC3の 出力が『1°となる。ANDゲートAC3の出力がマル チプレクサ21 cによって選択されているので、マルチ プレクサ21 cの出力が"1"となる。マルチプレクサ 入力となっているので、割込み信号BRが入力されてい ないときは、ANDゲートAC3の出力がそのままOR ゲート21 dの出力に伝送される。これがコンパレータ 21の出力、すなわちリセット信号RTFとなるので、 ハードウェアモジュールMOとM2の両方の処理が終了 したときに、リセット信号RTFが"1"となる。この リセット信号RTFによって、スリープ制御フリップフ ロップ24がリセットされ、その出力〇UTが \*0\* と なると、メインクロックCKの値が、ORゲート25の Kの供給が再開される。

【0040】次に、ハードウェアモジュールM0あるい はM2の処理の終了までCPU11をスリープさせる図 9のスリーブ命令が実行された場合について説明する。 【0041】スリープ命令によって、OR条件が指定さ れているので、マルチプレクサ21cによって、OR条 件ブロック21bの出力が選択される。OR条件ブロッ ク21 bでは、モジュール状態フラグレジスタ23とウ ェイクアップモジュールレジスタ22のM(), M1, M 2に対応するビットが、それぞれANDゲートOC(), OC1, OC2に入力される。ただし、モジュール状態 フラグレジスタ23の値は、反転された値が入力され **5.** (S0, S1, S2) = (1, 0, 1), (W0,**W1. W2) = (1, 0, 1) のときは、ANDゲート** OCO, OC1、OC2の出力は、それぞれ"O", "O", "O" であるから、これらの値を入力とするO RゲートOC3の出力は"O"となる。▼1=0である から、SIの値つまりハードウェアモジュールMIの動 作状態に関わらず、ANDゲートOCIの出力は"O" 常にとなる。すなわち、ウェイクアップモジュールとし(40) て指定されたハードウェアモジュールの動作状態だけ が、ORゲートOC3の出力に影響する。

【0042】ハードウェアモジュールM0の処理が終了 し、S0=0となると、ANDゲートOC0の出力が ~1~となり、これによって、ORゲートOC3の出力 も ~1 ~ となる。この値がマルチプレクサ21cとOR ゲート2 I dを通して、リセット信号RTFとしてスリ ープ制御フリップフロップ24に出力される。 【OO43】割込み信号BRが入力された場合は、マル

チブレクサ21cの出力に関係なくORゲート21dの 50 よる面積、消費電力のオーバヘッドも小さい。

出力が"1"となり、スリープ制御フリップフロップ2 4に対して、リセット信号RTFが出力されることにな

【0044】 ここでは、 CPU11をウェイクアップさ せる条件を、AND条件とOR条件のみで構成と動作を 説明したが、条件ブロックの回路を追加し、スリープ命 令コードの条件フィールドCOに複数ピットを使用する ことで、他の条件論理も実現できる。

【0045】また、特定のハードウェアモジュールの処 21 cの出力と、割込み信号BRがORゲート21dの 10 理終了によって、CPUllをウェイクアップさせる、 あるいはどのハードウェアモジュールの処理が終了して もCPU11をウェイクアップさせる場合には コンパ レータ21、ウェイクアップモジュールレジスタ22、 及びモジュール状態フラグレジスタ23は必要なくな る。ハードウェアモジュールからの処理終了信号と割込 み信号BRのOR演算の結果をリセット信号RTFとし てスリープ制御フリップフロップ24に入力すればよ い。これによって、パワーマネジメントモジュール20 を簡略化することができる。

出力にそのまま任送され、CPU11へのクロックCL 20 【0046】割込み信号BRが入力されると、スリープ 制御フリップフロップ24に対してリセット信号RTF が出力されることを利用して、回路がある状態になった 時にCPU11をウェイクアップさせることが可能とな る。例えばデータバスが所定の状態になったときにCP **U11をウェイクアップさせるのであれば、データバス** の状態を監視する回路を付加し、データバスがその状態 になったときに、割込み信号BRを出力するようにすれ ばよい。

> 【りり47】本実施形態では、従来のシステムLSIに 30 パワーマネジメントモジュール20を追加した構成で説 明をしたが、これは説明を容易にするためであり、この 機能をCPU11の中に含めてもよい。この場合は、ウ ェイクアップモジュールレジスタ22.モジュール状態 フラグレジスタ23及びスリーブ制御フリップフロップ 24に相当する回路には、常にクロックが供給されるよ うにすることで、同様の動作が実現できる。

【0048】このように本実施形態では、ソフトウェア (スリープ命令) によってCPU11をスリープさせる タイミングを制御するようにしたので、プログラマがC PUllをいつスリープさせるかを決定することがで き、無駄なスリーブの実行による性能低下を避けること が可能となる。さらに、ハードウェアによってCPU1 1のウェイクアップを制御することによって、スリープ 期間を予測すること無しに適切な期間だけスリープさせ ることが可能となる。これにより、無駄なスリープの実 行による性能低下を避けつつ低消費電力化効果を大幅に 向上させることが可能となる。また、これらの機能を実 現するパワーマネジメントモジュール20は、非常に簡 単なハードウェアで実装することができるため、これに

12

【りり49】複数の命令で構成されていたハードウェア モジュール処理終了待ちルーチンを、1つのスリープ命 令に置き換えるので、プログラムを格納するために必要 となるメモリ量が小さくなり、また、実行される命令数 も従来のプログラムより少なくなる。さらに、CPUが スリープしている間は、命令メモリはアクセスされない ので、この間は、命令メモリもスリーブさせることがで きる。これらのことによって、命令メモリの消費電力も 削減される。

11

図10、図11及び図12を参照して説明する。

[0051]5つのハードウェアモジュールMO、M M2, M3、M4を持つ図1に示したシステムLS Ⅰにおいて、実行されるプログラムの一部が図 1 ()に示 すようなフローチャートで表される場合を考える。ここ で、処理1.1、処理1.2、処理2.1、処理2. 2. 及び処理3で、それぞれハードウェアモジュールM 0、M1, M2、M3, M4に対して処理命令が出され るとする。処理3が終了した後に、ハードウェアモジュ ール処理終了待ちルーチンがあるため、これをスリープ 20

命令に置き換えることによって、CPU11をスリープ

させ、消費電力の削減を図る。 【0052】しかし、このルーチンが、実行された処理 において処理命令を与えられた全てのハードウェアモジ ュールの処理が終了するのを待つものであるとすると、 図2のスリープ命令コードでは実現できない。なぜな ら、図2のスリープ命令では、ウェイクアップ命令を明 示的に推定する必要があるのに対し、このプログラムで は、条件分岐があるために、処理命令を出されるハード ウェアモジュールが1組に決定されないからである。 【0053】そこで、図11に示す第2のスリープ命令 コードを導入する。このスリープ命令コードは、オペコ ードOPと1つのレジスタフィールドRGとからなる。 レジスタフィールドRGでは、あるレジスタを1つ指定 する。ここで指定されるレジスタには、図2のスリーブ 命令コードでのウェイクアップモジュールフィールド♥ Uと条件フィールドCOの値に相当する内容を铬钠して おく。このスリーブ命令をデコードし実行するときに、 レジスタフィールドRGで指示されたレジスタの値をパ

【0054】次に、このスリープ命令を用いて、CPU 11をスリープ状態にする方法を図12のフローチャー トを参照して説明する。

て、CPU11のウェイクアップを制御する。

ワーマネジメントモジュール20に転送することによっ 40

【0055】レジスタフィールドRGで指定されたレジ スタの最上位ビットが条件フィールドCOに相当し、最 下位ピットからちピットがウェイクアップモジュールフ ィールドWUに担当するとする。また、スリープ命令で は、汎用レジスタr8が指定されるとする。

【0056】図12において、まず、スリーブ動作に関 50 れていれば、CPU11へのクロックの供給を再開させ

わる処理を行う前に、「r8」に「0x0000」を代 入することによって初期化しておく。処理1.1におい てハードウェアモジュールM() に処理命令を出した後 に、「r8」の値と「0 x 0 0 0 1 」をOR油算を行 う。 同様に、処理1.2.処理2.1.処理2.2、及 び処理3において、ハードウェアモジュールM1、M 2、M3、M4に処理命令を出した後に、「r8」の値 £ [0x0002], [0x0004], [0x000 8」、「0x0010」とのOR演算をそれぞれ行い、 【0050】【第2実施形態】本発明の第2実施形態を(10)その結果を「18」に格納しておく。条件フィールドC ○の値を指定するために、スリープ命令を実行する前 に、AND条件ならば「0x0000」、OR条件なら 「0×8000」と「r8」とのOR海算をそれぞれ行

> 【0057】このようにすることによって、例えば、処 理1.1、処理2.1を行い、AND条件でCPU11 をウェイクアップさせる場合には、「18」の内容が 「Ox0015」となり、ハードウェアモジュールMO とM2のAND条件によって、CPU11をウェイクア ップさせるというスリーブ動作を実現することができ る.

【0058】なお、パイプライン処理をしているため に、スリーブ命令が実行段に入る前に先行する命令を完 了させたい場合がある。例えば、ロード/ストア命令な ど、CPU11での処理でメモリ12にアクセスする場 台、CPU11からのアクセス要求が出たままになる と、他モジュールがアタセスできなくなる場合である。 その場合には、スリープ命令の前に必要な数のNOP命 令を挿入し、その命令が終了してからスリープ命令が実 30. 行されるようにする。

【0059】次に、上記第1及び第2実施形態に用いら れる、CPUllに対するスリープ及びウェイクアップ 処理の実行手順を、図13のフローチャートを参照して 説明する。

【0060】まず、CPUllが次に実行する命令をデ コードし(ステップS11)、それが、CPU11をス リープさせるスリープ命令であるかを判断する(ステッ プS12)。スリープ命令であれば、この命令によって 指示される、CPUllをウェイクアップさせるための - 条件がレジスタに格納される、(ステップS13)。 さら に、CPUllへのクロックの供給を停止させる信号が 生成され、この信号によってCPU11がスリープする (ステップ\$14)。

【0061】CPU11がスリープしている時に、ある ハードウェアモジュールの実行中の処理が終了すると、 処理終了信号が生成される(ステップS15)。そのハ ードウェアモジュールの処理終了によって、格納してお いたCPUllへのクロック供給を再開させる条件が満 たされたか否かが判断され(ステップS16)、満たさ

る信号が生成され、CPU11がウェイクアップする (ステップS17)。

【0062】[第3実施形態]上記第1及び第2実施形 態では、あるハードウェアモジュールの処理が終了する までCPU11が次の処理を実行できない場合におい て、CPU11をソフトウェア (スリープ命令) によっ てスリーブ状態にし、そのハードウェアモジュールから の処理終了信号によってCPU11をウェイクアップさ せている。この際に用いられるスリーブ命令コードは、 アモジュールからの処理終了信号によってCPU11を ウェイクアップさせるかを指定するウェイクアップモジ ュールフィールドWUと、ウェイクアップモジュールフ ィールドWUで複数のハードウェアモジュールが指定さ れた時にそれらの全て処理が終了したらCPUlleウ ェイクアップさせるAND条件、及びそれらのいずれか の処理が終了したらCPU11をウェイクアップさせる OR条件を表す条件フィールドCOとからなる。上記第 1及び第2実施形態では、このようなスリープ命令コー 手によってハードウェアモジュール処理終了待ちルーチ ンをスリーブ命令に置き換えなければならないという不 具合があった。

【0063】この不具台を解消するために、本第3実施 形態では、従来のプログラムにおけるハードウェアモジ ュール処理終了待ちルーチンを前記スリーブ命令に自動 的に置き換える機能を設けている。以下、その手法につ いて詳細に説明する。

【0064】図14は、システムLSIのプログラムに おけるハードウェアモジュール処理終了待ちルーチンの 30 一例を示す図である。

【0065】同図において、まず、mfc命令によっ て、ハードウェアモジュールの状態レジスタState の値を汎用レジスタト2にロードする。ここで、状態レ ジスタStateの各ピットは、対応するハードウェア モジュールが処理を実行中であれば"1"、処理を終了 していれば "0" とする。

【0066】続いてandi命令によってロードした値 にマスクをかける。これは、andi命令の第3オペラ ンドが「0x0003」であるから、状態レジスタst ateの第0ビット(LSB)と第1ビットに対応する ハードウェアモジュール(以下、それぞれMO、M1と する)の動作状態のみを取り出している。そして、カカ e命令によって、常に"O"であるレジスタ r O との比 較を行い、その結果が等しくなければ、もう一度、 m f c 2 命令に分岐し、等しければ、そのルーチンを抜け る。つまり、このルーチンは、ハードウェアモジュール MO、M1の両方の処理が終了するのを待つルーチンと いうことになる。

換えることを考える。

【0068】本例の場合は、ハードウェアモジュールM M1の処理の終了によって、CPU11をウェイク アップさせるのであるから、スリーブ命令のウェイクア ップモジュールフィールドWUは、「0x0003」と なる。また、ハードウェアモジュールM()とM1の両 方、つまりウェイクアップモジュールフィールドWUで 指定した全てのハードウェアモジュールの処理が終了し たら、CPU11をウェイクアップさせるので、条件フ スリーブ命令を表すオペコードOPと、どのハードウェ 10 ィールドCOの値はAND条件となる。したがって、対 応するスリープ命令は、図15に示すようになる。ここ で、スリープ命令を表すオペコード〇Pを"11111 I"、条件フィールドCOの値は、AND条件が "()"、〇R条件が"1"とする。

【0069】ハードウェアモジュール処理終了待ちルー チンのもう一つの例を、図16に示す。この例では、ま ず、レジスタェ3に「0x0003」を代入しておき、 . これをmlc2命令の次のand命令でマスクとして用 いている。マスクをかけた状態レジスタstateの値 ドをコンパイラにより生成することができないため、人 20 が r 3 と同じであった場合。つまりハードウェアモジュ ールMO、M1のいずれの処理も終了していない場合 は、分岐が成立し、異なっていた場合、つまり、ハード ウェアモジュールMOまたはMIのいずれかの処理が終 了していた場合に、このルーチンから抜ける。すなわ ち、このルーチンは、ハードウェアモジュールMOまた はM1のいずれかの処理が終了するのを待つためのルー チンである。したがって、このルーチンをスリーブ命令 に置き換えると、図17に示すようになる。ことで、ウ ェイクアップモジュールフィールドWUの値は、ハード ウェアモジュールM0及びM1を示す「0x0003」 であり、条件フィールドCOは、ハードウェアモジュー ルMOまたはM1のいずれかの処理が終了するまでCP Ulleスリープさせるので、OR条件となる。

【0070】コンパイラにおいて、このような命令系列 を生成する手続きを、スリープ命令を生成する手続きに 置き換えることによって、スリーブ命令を自動的に生成 することができる。

【0071】次に、ハードウェアモジュール処理終了待 ちルーチンをスリープ命令に置き換えるための手続きに 40 ついて、図18及び図19を参照して説明する。

【0072】図18のフローチャートにおいて、まず、 ソースコードをコンパイラによって、アセンブリコード に変換する(ステップS21)。次に、これをフィルタ リングすることによって、ハードウェアモジュール処理 終了持ちルーチンをスリープ命令に変換する(ステップ S22)。最後に、変換したアセンブリコードをアセン ブルすることによって、スリープ命令を含む機械語を生 成する(ステップS23)。

【0073】ステップS22でのフィルタリングには、 【0067】次に、このルーチンをスリープ命令に置き 50 変換テーブルを用いる。変換テーブルは、ハードウェア

(9)

モジュール処理終了待ちルーチンを実現している命令系 列と、その命令系列に対応したスリープ命令の組み合わ せとからなる。命令系列のオペランドは、定数と変数に よって表現する。図19に、図14と図15の命令系列 をスリープ命令に変換するための変換テーブルの例を示 す。

【0074】図19において、まず、変数と定数の宣言 を行う。ここでは、\$const以下のstate、r O. and、orが定数であり、\$var以下のreg abel以下のLABEL1とLABE2は、分岐先が 一致するかの判定のための特殊変数(以下、ラベル変数 と呼ぶ) である。\$tableと\$endtableで 囲まれた部分が変換テーブルの実態であり、この中の多 stream以下が命令系列、\$format以下が変 換するスリーブ命令のフォーマットである。

【りり75】さらに、フィルタリングの手続きについて 説明する。フィルタは、アセンブリコードの最初から順 に、変換テーブルの命令系列との比較を行っていく。比 かを制定する。一致したら、次にオペランドが一致する かを判定する。この際に、変換テーブルで定数として与 えられているオペランドは、そのまま比較を行う。変数 として与えられているオペランドには、その変数を用い て行う最初の比較の際に、アセンブリコードのオペラン ドの値を代入し、次にその変数との比較を行う時には、 代入した値を用いて比較を行う。比較の結果、両者が一 致したら、アセンブリーコード中の命令系列を、810 rmatで与えられた、スリープ命令のフォーマットに 従って置き換える。

【0076】以下、あるアセンプリコード中に図14に 示すようなハードウェアモジュール処理待ちルーチンが ある場合に、これを図19に示した変換テーブルでスリ ープ命令に変換する際の手順について具体的に説明す

【0077】アセンブリコード中に「LABEL1:」 が現れたので、このラベルの位置を铬钠しておく。次 に、m f c 2 命令があり、これが、変換テーブル中の命 **令系列の最初の命令と一致するので、そのオペランドの** 比較を行う。変換テーブル中のm f c 2 命令の第1オペ 40 ランドがTeglという変数であるから、これに、アセ ンプリコード中のm f c 2 命令の第1オペランドの値 r 2が代入される。変換テーブルのmfc2命令の第2オ ベランドは定数であるから、そのまま比較を行う。

【0078】mfc命令はオペランドも一致するので、 次の命令の比較を行う。両者ともandi命令で一致す るので、第1オペランドの比較を行う。変換テーブルの andi命令の第1オペランドは変数reg2なので、 これにアセンブリコード中のandi命令の第1オペラ ンドェ2が代入される。

【0079】変換テーブルのandi命令の第2オペラ ンドは既出のTeg1であるから、先にこの変数に代入 した r 2 を用いて比較する。 第3 オペランドの比較で は、imm1に「0x0003」が代入される。次のb ne命令の比較では、第2オペランドまでは同様であ

【0080】変換テーブルのhne命令の第3オペラン FのLABEL1は、ラベル変数であるから、アセンブ リコード中のbne命令の第3オペランドのラベルと分 1. reg2. imm1. imm2が変数である。\$ | 10 岐先が同じであるかの判定を行う。この例の場合. 双方 ともmfc2命令に分岐しているので、一致する。変換 テーブルの命令系列と全て一致したので、アセンブリコ ード中のその命令系列を、\$formatで与えられた フォーマットに従ってスリープ命令に置き換える。この 例の場合、1mm1が変数であるから、andi命令の 比較の時に代入された「0x0003」が用いられる。 【0081】とのように、本実施形態では、従来のプロ グラム中のハードウェアモジュール処理終了待ちルーチ ンであった命令系列を自動的にスリーブ命令に置き換え 較は次のように行う。まず、オペコードOPが一致する 20 ることができるので、その分、プログラマの労力が減少 し、システムしSIにおける低消費電力設計の効率化を 図ることが可能になる。

[0082]

【発明の効果】以上詳細に説明したように、請求項1乃 至論求項4記載の発明であるシステムしS | によれば、 ソフトウェア(スリープ命令)によってCPUに対する クロック供給の停止(スリープ)を制御することができ るので、無駄なスリーブの実行による性能低下を避けつ つ低消費電力化を図ることが可能となる。さらに、ハー 30 ドウェアによってCPUに対するクロック供給の再開 (ウェイクアップ) を制御することによって、スリープ 期間を予測すること無しに適切な期間だけスリープさせ ることができ、無駄なスリーブの実行による性能低下を 避けつつ低消費電力化効果を大幅に向上させることが可 能となる。また、これらの機能を実現するパワーマネジ メント装置は、非常に簡単なハードウェアで実装すると とができるため、これによる面積、消費電力のオーバへ ッドも小さい。また、従来のプログラム中に存在するハ ードウェアモジュール処理終了待ちルーチンを1つのス リープ命令に置き換えることにより、命令の実行数が従 来のプログラムより少なくなるため、メモリアクセスに よる消費電力も削減することができる。さらに、複数の 命令を1命令に置き換えるので、プログラムを格納する ために必要となるメモリ量も小さくなる。

【0083】請求項5記載の発明であるシステムしSI によれば、スリープ命令は、第1のフィールドの値を格 納したレジスタを指定する第2のフィールドを有し、パ ワーマネジメント装置は、 第1と第2のフィールドの内 容を参照してCPUに対するクロック供給を再開する構 50 成にしたので、例えば条件分岐を含むプログラムにおい

特開2000-112585

て、処理命令を出されるハードウェアモジュールが1組 に決定されないような場合であっても、CPUに対する クロック供給の再開を的確に制御することができ、上記 発明と同等の効果を享受することが可能になる。

17

【0084】請求項6記載の発明であるシステムしSI によれば、ハードウェアモジュールの処理の終了を待つ ために用いられるプログラム中のルーチンをスリープ命 令に自動的に置き換えるようにしたので、システムLS 1における低消費電力設計の効率化を図ることが可能に なる.

【0085】請求項7記載の発明であるパワーマネジメ ント方法によれば、上記論求項1乃至論求項4記載の発 明と同等の効果を享受することができる。

【0086】また、複数の命令で構成されていたハード ウェアモジュール処理終了待ちルーチンを、1つのスリ ープ命令に置き換えるので、プログラムを格納するため に必要となるメモリ量が小さくなり、また、実行される 命令数も従来のプログラムより少なくなる。さらに、C PUがスリープしている間は、命令メモリはアクセスさ れないので、この間は、命令メモリもスリープさせるこ 20 とができる。これらのことによって、命令メモリの消費 電力も削減される。

`【図面の簡単な説明】

【図1】本発明の第1実施形態に係るシステムしSIの 構成を示すブロック図である。

【図2】 スリープ命令コードの構成を示す図である。

【図3】スリーブ命令コードの具体的構成例を示す図で ある。

【図4】システムLSIのプログラム中のルーチンを示 す図である。

【図5】パワーマネジメントモジュール20の構成を示 すブロック図である。

【図6】第1実施形態に係るシステムしS | の具体的機 成例を示すブロック図である。

【図7】図6に示したシステムLSIの構成においてバ ワーマネジメントモジュール内のコンパレータの構成例 を示す回路図である。

【図8】図6に示したシステムLSIに使用されるスリ ープ命令コードの具体的構成例を示す図である。

【図9】図6に示したシステムLSIに使用されるスリ\*40・M1~Mn ハードウェアモジュール

\*ープ命令コードの他の具体的構成例を示す図である。

【図10】本発明の第2実施形態を説明するためのプロ グラムのフローチャートである。

【図11】第2実施形態に係るスリープ命令コードの構 成を示す図である。

【図12】第2実施形態に係るCPUのスリーブ動作を 説明するフローチャートである。

【図13】CPU11に対するスリーブ及びウェイクア ップ処理の実行手順を示すフローチャートである。

【図14】システムLSIのプログラムにおけるハード ウェアモジュール処理終了待ちルーチンの一例を示す図 である。

【図15】図14に示した例に係る。第3実施形態のス リープ命令コードの構成を示す図である。

【図16】システムLSIのプログラムにおけるハード ウェアモジュール処理終了待ちルーチンの他の例を示す 図である。

【図17】図16に示した例に係る。第3実施形態のス リーブ命令コードの構成を示す図である。

【図18】ハードウェアモジュール処理終了待ちルーチ ンをスリーブ命令に置き換えるための第3実施形態の処 理を示すフローチャートである。

【図19】図14と図15の命令系列をスリープ命令に 変換するための変換テーブルの例を示す図である。

【図20】従来のシステムしSIの構成を示すブロック 図である。

【符号の説明】

11 CPU

12 メモリ

20 パワーマネジメントモジュール

21 コンパレータ

22 ウェイクアップモジュールレジスタ

モジュール状態フラグレジスタ 23

24 スリープ制御フリップフロップ

25 OR ゲート

OP スリープ命令を表すオペコード

WU ウェイクアップモジュールフィールド

CO 条件フィールド

RG レジスタフィールド

[図2]

[図4]





http://www6.ipdl.jpo.go.jp/tjcontenttrns.ipdl?N0000=21&N0400=image/gif&N0401=/NSAPI.. 3/14/03





